1 research outputs found

    Desenvolvimento de uma abordagem para reconhecimento cont?nuo da L?ngua Brasileira de Sinais utilizando imagens din?micas e t?cnicas de aprendizagem profunda.

    Get PDF
    Programa de P?s-Gradua??o em Ci?ncia da Computa??o. Departamento de Ci?ncia da Computa??o, Instituto de Ci?ncias Exatas e Biol?gicas, Universidade Federal de Ouro Preto.Durante os ?ltimos anos, t?m sido desenvolvidas diversas abordagens para o reconhecimento cont?nuo de l?nguas de sinais para melhorar a qualidade de vida das pessoas surdas e diminuir a barreira de comunica??o entre elas e a sociedade. Analogamente, a incorpora??o do dispositivo Microsoft Kinect gerou uma revolu??o na ?rea de vis?o computacional, fornecendo novas informa??es multimodais (dados RGB-D e do esqueleto) que podem ser utilizadas para gerar ou aprender novos descritores robustos e melhorar as taxas de reconhecimento em diversos problemas. Assim, nessa pesquisa de doutorado, apresenta-se uma metodologia para o reconhecimento de sinais cont?nuos da L?ngua Brasileira de Sinais (LIBRAS) utilizando como dados de entrada de um sinal as informa??es fornecidas pelo dispositivo Kinect. Diferentemente dos outros trabalhos na literatura, que utilizam arquiteturas de redes mais complexas (como as 3DCNN e BLSTM), o m?todo proposto utiliza janelas deslizantes para procurar segmentos candidatos de serem sinais dentro de um fluxo continuo de video. Do mesmo modo, prop?e-se o uso de imagens din?micas para codificar as informa??es espa?o-temporais fornecidas pelo Kinect. Assim, pode-se reduzir a complexidade da arquitetura CNN proposta para o reconhecimento dos sinais. Finalmente, baseado no conceito de pares m?nimos, um novo banco de dados da L?ngua Brasileira de Sinais chamado LIBRAS-UFOP ? proposto. A base LIBRAS-UFOP possui tanto sinais isolados (56 classes de sinais) como sinais cont?nuos (37 classes); n?s avaliamos nosso m?todo usando essa base e o comparamos com os m?todos propostos na literatura. Os resultados experimentais nos datasets LIBRAS-UFOP e LSA64 demostraram a validade do m?todo proposto baseado em imagens din?micas como uma alternativa para o reconhecimento de l?ngua de sinais.In the last years, several approaches have been developed for continuous sign language recognition to improve the quality of life of hearingimpaired people and reduce the communication barrier between them and society. Similarly, the incorporation of the Microsoft Kinect device originated the computer vision revolution, providing new multimodal information (RGB-D and skeleton data) that can be used to generate or learn new robust descriptors and improve data recognition rates in several problems. Thus, in this doctoral research, we propose a methodology for the continuous recognition of Brazilian sign language (LIBRAS), using as input data from a sign the information provided by the Kinect device. Unlike other works in the literature that use more complex network architectures (such as 3DCNN and BLSTM), the proposed method uses sliding windows to search for candidate segments of being signs within a continuous flow of video. Likewise, we proposed to use dynamic images to encode the spatiotemporal information provided by the Kinect. Thus, we can reduce the complexity of the proposed CNN architecture for sign recognition. Finally, based on the concept of minimal pairs, a new dataset of Brazilian Sign Language called LIBRAS-UFOP is proposed. The LIBRAS-UFOP dataset is composed of isolated signs (56 classes) and continuous signs (37 classes); we evaluate our method on this dataset and compare it with state-of-the-art methods. The experimental results on LIBRAS-UFOP and LSA64 datasets proved the feasibility of the proposed method as an alternative to sign language recognition
    corecore